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@ Verfahren zur Identifizierung von Mikroorganisnnen mittels MALDI-TOF-MS 

@ Die Erfindung betrlfft ein Verfahren zur Identifizierung 
von Mikroorganismen mittels Matrix-assisted-Laser-De- 
sorption-lonisation Time-of-Flight Massenspektrometrle 
(MALDI-TOF-MS), wobei eine Datenbank mit Referenz- 
spektren, bestehend aus Massenspektren einer Anzahl 
bekannter Mikroorganismen, erstellt wird, ein MALDI- 
TOF-Massenspektrum (Probenspektrum) einer Probe ei- 
neszu identifizierenden Mikroorganismusaufgenommen 
wird und eine Ahnlichkeitsanalyse des Massenspektrums 
des zu identifizierenden Mikroorganismus mit den in der 
Datenbank enthaltenen Referenzspektren durchgefuhrt 
wird. 

Es ist vorgesehen, dass als Referenzspektren (REF) syn- 

thetische Massenspektren (REFg) verwendet werden, die 

durch Zusammenfassung einer gegenuber naturlichen 
■ Massenspektren reduzierten Anzahl von fur den jeweili- 
f gen Mikroorganismus spezifischen Signaten (S) erzeugt 
M werden. 



CO 
CO 




lU 



DE 100 38 

1 

Beschreibung 

[0001] Die Erfindung betriffl ein Verfahren zur Identifizie- 
rung von Mikroorganismen mittels Matrix-assisted-Laser- 
Desorption-Ionisation-Time-of- Flight Massenspektrometrie 5 
(MALDI-TOF-MS) mil den im Oberbegrifif des Anspruchs 
1 genannten Merkmalen sowie eine nach dem Verfahren er- 
stellte und fur das Verfahren verwendbare Dalenbank. 
[0002] Bine schnelle und zuverlassige Identifizierung von 
Mikroorganismen ist in verschiedenen Bereichen des Ge- lO 
sundheitswesens, beispielsweise der Diagnostik von Tnfek- 
tionen, sowie der Ixbensmittelindustrie von entscheidender 
Bedeutung. Die traditionelle Identifizierung mittels des di- 
rekten Bakteriennachweises erfordert zunachst die Anziich- 
tung der zu identifizierenden Mikroorganismen aus einer 15 
Materialprobe. AnschlieBende mikroskopische Untersu- 
chungsverfahren dienen hauptsachlich der vorlaufigen Ori- 
entierung iiber den Bakteriengehalt sowie der Mikromor- 
phologie beziehungsweise Farbeeigenschaften der klini- 
schen Untersuchungsprobe. Die Identifizierung von Isolaten 20 
bis zur Speziesebene erfordert nicht selten eine Subkultivie- 
rung zwecks der Gewinnung einer Reinkultur. Nach dem 
klassischen Identifizierungsverfahren der medizinischen 
Mikrobiologie werden schlieBlich unter Verwendung einer 
geeigneten Konibination von DifTerentialniedien (soge- 25 
nannte "Bunte Reihe"), spezifische StofFwechselleistungen 
des zu identifizierenden Mikroorganismus erf asst. Haupl- 
nachleil des mikrobiellen Verfahrens ist sein sehr hoher 
Zeitbedarf. Modemere molekularbiologische Ansatze, wie 
die PCR-Methode (Polymerase-Kettenreaktion) und die 30 
16S-rRNA-Mcthodc, involviercn die gcnctischc Analyse 
des zuvor isolierten Genoms beziehungsweise besummter 
Ribonukleinsaurcn. Dicsc Verfahren haben wcgcn ihrer ho- 
hcn Empfindlichkcit stark an Bedeutung gcwonnen. Sie er- 
fordcm cbcnso wie die mikrobiologische Charaktcrisicrung 35 
cine Kultivicrung der Oiganismcn im Labor und sind dar- 
Uber hinaus mit einem erheblichen personellen und instru- 
mcntcllcn Aufwand belastct. Fcmcr ist ein infrarotspcktro- 
skopisches Verfahren entwickelt worden, bei dem Schwin- 
gungsspektren intakter Zellen ("Fingerprintspektren") in 40 
Fl'lK-Spektrometem aufgezeichnet und mit einer Daten- 
bank mit Schwingungsspektren bekannter Mikroorganis- 
men abgeglichen wird. Diese noch sehr neue Technik befin- 
det sich noch in der Entwicklung und kann derzeit nur von 
speziell geschultem und erfahrenem Personal durchgefiihrt 45 
werden, so dass sich dieser Ansatz noch nicht in der Praxis 
durchselzen konnte. 

[0003] Mit der sogenannten MALDI-TOF-Massenspek- 
U-omeuie ist in den letzten Jahren ein Verfahren entwickelt 
worden, das im Gegensatz zu herkommlichen massenspek- 50 
trometrischen Verfahren auch der Analyse biologischer Ma- 
kromolekiile zuganglich ist. Bei der MALDI-TOF-MS- 
Technik wird die zu untersuchende Probe mit einer meist 
kristallinen organischen Verbindung, der sogenannten Ma- 
trix, auf eine Probenplatte gegeben, wobei die Probe in die 55 
Matrixkristalle eingebaut wird, und mit einem Laserstrahl in 
Wechselwirkung gebracht. Dabei werden einzelne Molekule 
der Probe von dem Probentrager desorbiert und ionisiert. 
AnschlieBend werden die so erzeugten lonen in einem elek- 
trischen Feld beschleunigt und ihre Flugzeit (Time-of- 60 
Flight) bis zum Brreichen eines Detektors registriert. Da die 
Beschleunigung von der Masse eines ionisierten Molekiils 
abhangt, spiegeln die Flugzeiten die in der Probe vorhande- 
nen Molekiilmassen wider. Die MALDI-TOF-MS-Tfechnik 
findet heutzutage hauptsachlich auf dem Gebiet der Protein- 65 
analytik ("Proteomics") und bei der RNA- und DNA-Analy- 
tik Anwendung. Es wurde vorgeschlagen, die Methode zur 
Identifizierung von Mikroorganismen in Analogic zu der 
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oben beschriebenen infrarotspektroskopischen Fingerprint- 
methode einzusetzen. Dafiir wird das MALDI-TOF-Mas- 
senspektrum eines Zellextraktes oder intakter Zellen (zum 
Beispiel WO 98/09314) des unbekannten Mikroorganismus 
mit den Spektren bekannter Organismen verglichen. Der 
Vergleich des Probenspekurums mit den Referenzspektren 
der Datenbank erfolgt in der Regel computergestiitzt mittels 
statistisch-mathematischer Algorithmen, die in sogenannten 
Mustererkennungsverfahren entwickelt wurden. Die Mas- 
senspektren ahneln sich mit wachsender verwandtschaftli- 
cher Nahe der Mikroorganismen zunehmend. Das heiBt, die 
Waht^cheinlichkeit einer Wiederholung bestimmter Signale 
in den Massenspektren nimmt zu. Daher ist das Verfahren 
bei ubergeordneten Klassifizierungsniveaus, etwa bei Gat- 
tungen oder Familien, mil einer erhohten Unsicherheit ver- 
bunden, wenn eine Zuordnung auf Stammniveau fehl- 
schlagt, beispielsweise weil kein Referenzspektrum des 
Stammes in der Datenbank vorhanden ist. Das Verfahren ist 
daher auf sehr umfangreiche Datenbanken mit einer Viel- 
zahl reprasentativer Referenzspektren von bekannten Stam- 
men angewiesen. Hinzu kommt die Schwierigkeit, ein spek- 
trales Grundrauschen von echten Signalen zu diskhminie- 
ren. 

[0004] Aufgabe der vorliegenden Erfindung ist es daher, 
das gattungsgemafie MALDI-TOF-MS-Verfahren zur Iden- 
tifizierung von Mikroorganismen dahingehend weiterzuent- 
wickein, dass seine Zuverlassigkeit erhohl wird, ohne den 
erforderlichen Prozessaufwand zu vergroSem. Es soil femer 
eine nach dem Verfahren erstellte und fiirdas Verfahren ein- 
selzbare Datenbank zur Verfugung gestelll werden. 
[0005] Dicsc Aufgabe wird durch ein Verfahren mit den 
Merkmalen des Anspruchs 1 sowie durch eine Datenbank 
und ihre Verwendung nach den AnsprUchen 13 und 14 ge- 
lost. 

[0006] VerfahrensgemaB ist voigesehen, dass als Refe- 
renzspektren synthetischc Massenspektren verwcndet wer- 
den, die durch l^usammenfassung einer gegeniiber "natiirli- 
chcn" (nicht rcduziertcn) Massenspektren rcduzicrtcn An- 
zahl von fiir den jeweiligen Mikroorganismus spezifischen 
Signalen erzeugt werden. Durch die Reduzierung der Refe- 
renzspektren auf eine verhaltnismaBig geringe Anzahl cha- 
rakteristischer Signale, wird eine erhebliche Daten- und In- 
formationsreduktion erreicht. Durch die Datenredukdon 
wird nicht nur Speicherplatz eingespart, sondem auch ein 
zeitlicher Aufwand ftir Dateniibertragungen, so dass das 
Verfahren prinzipiell auch fur eine Anwendung iiber ver- 
netzte Datenverarbeitungsanlagen (z. B. Internet) geeignet 
ist. Dariiber hinaus ermoglicht die Informationsreduktion 
der Referenzspektren der Datenbank eine deutliche Be- 
schleunigung der Ahnlichkeitsanalyse des Massenspek- 
trums des zu identifizierenden Mikroorganismus mit den 
Referenzspektren, da die Analyse sich nunmehr auf einen 
Vergleich der in den Referenzspektren enthaltenen Signale 
beschranken kann. 

[0007] Verglichen mit herkommlichen Verfahren, in de- 
nen ein Probenspektrum des zu identifizierenden Organis- 
mus mit "naturlichen" Referenzspektren abgeglichen wird, 
ist eine Zuverlassigkeit des erfindungsgemaBen Verfahrens, 
das heiBt die Wahrscheinlichkeit, eine korrekte Zuordnung 
des unbekannten Organismus zu treffen, deutlich erhohl. 
Hierin ist der bedeutendeste Vorteil der Erfindung zu sehen. 
Die erhohte Zuverlassigkeit ist durch die hohe Konzentrie- 
rung spezifischer Informationen in den Referenzspektren zu 
erklaren, die nicht durch Signale geringer Signifikanz oder 
Rauschen uberdeckt wird. Auch bei einem moglichen Versa- 
gen bei einer Zuordnung auf Stammebene einer Probe, etwa 
weil kein Referenzspektrum dieses Stammes in der Daten- 
bank verfugbar ist, liefert das Verfahren zuverlassige Identi- 
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fizieningen auf ubergeordneten Klassifizierungsebenen, bei- 
spielsweise auf Gattungs- oder Artenebene. Die Empfind- 
lichkeil der erfindungsgemaBen Vorgehensweise wird auch 
nicht durch Unterschiede in verschiedenen Spektren beein- 
trachtigt, welche beispielsweise durch unterschiedliche Kul- 
tivierungsbedingungen, unterschiedliche Zellstadien oder 
abweichende Signal-Rauschverhaltnisse verursacht werden. 
[0008] Ein weiterer Vorteil des Verfahrens stellt die ge- 
ringe erforderliche Probenmenge des zu identifizierenden 
Mikroorganismus dar, die in kurzeren Kultivierungszeiten 
erhaltlich ist. Femer konnen auch Mischkulturen analysiert 
werden, so dass auf die Anzucht von Reinkulturen verzich- 
tet werden kann. 

[0009] Die in den synthetischen Referenzspektren enthal- 
tenen Signale konnen in zwei Kategorien unterschieden 
werden. Eine besonders vorteilhafte Ausgestaltung der Er- 
findung sieht vor, dass die Signale eines Referenzspektrums 
mindestens ein identifiziertes Signal umfassen, welches ei- 
nem charakterisicrten molekularen Zellbestandteil des je- 
weiligen Mikroorganismus eindeutig zugeordnet wurde. Zur 
Identifizierung eines Mikroorganismus geeignete Zellbe- 
standteile sind beispielsweise bestimmte Peptide, Proteine, 
Ribonukleinsauren und/oder Lipide. Es hat sich als beson- 
ders vorteilhaft erwiesen, eine Signalzuordnung eines ribo- 
sonialen Proteins, insbesondere eines Proteins der groBen 
Ribosoinenuntereinheil, vorzunehmen. Fiir Baklerien sind 
dies Proteine der sogenannten 50S-Untereinheit und bei Pii- 
zen die 60S-Unlereinheit. Proteine slellen einen Hauplbe- 
standteil mikrobieller Zellen dar. Dies gilt insbesondere fur 
Ribosomenproteine, die unabhangig von einem Entwick- 
lungsstadium der Zellc, cincm Nahrstoffangebot oder son- 
stiger Kultivierungsbedingungen standig prasent sind und 
somit zuverlassigc Signale in den Masscnspcktren darstcl- 
Icn. Hinzu kommt, dass Aminosaurcscquenzcn analoger 
Proteine untcrschicdiichcr Spezics oder sogar untcrschicdli- 
chcr Stamme sich zumindest gcringfiigig voneinander unter- 
scheiden. Folglich weisen die analogen Proteine unter- 
schiedliche Massen auf und cignen sich fur dcren Unter- 
scheidung. So gelang den Erfindem beispielsweise erstma- 
lig die Zuordnung dreier Massensignale in dem Massen- 
spekUiim von Escherichia coli (m/z = 4365, 6413, 7276) zu 
den Proteinen L29, L30 und L36 der groBen 50S-Riboso- 
menuntereinheit. Diese Signale sind standige Bestandteile 
in Massenspektren von £. coli, nicht jedoch von den meisten 
anderen Mikroorganismen. Sie sind daher besonders zur 
Identifizierung von Escherichia coli und zur Aufnahme in 
ein synthetisches Referenzspektrum fur E. coli geeignet. 
[0010] In einer weiteren Ausbildung der vorliegenden Er- 
findung ist vorgesehen, dass die Signale eines synthetischen 
Referenzspektrums als zweite Signalkategorie mindestens 
ein empirisches Signal umfassen, welches durch Veigleich 
einer Vielzahl von Massenspektren bekannter Mikroorga- 
nismen als spezifisch fiir einen Mikroorganismus ennittelt 
wurde. Dabei handelt es sich um Signale, deren Ursprung, 
das heiBt deren verursachende molekulare Zellkomponente, 
zwar nicht bekannt ist, die jedoch aufgrund bestimmier Kri- 
terien als charakteristisch fiir einen Mikroorganismus ge- 
werlet werden. Vorzugsweise umfassen diese Kriterien eine 
vorgebbare Mindest-Haufigkeit fur das Auftreten eines Si- 
gnals in einer Anzahl von Massenspektren des selben Mi- 
kroorganismus sowie eine vorgebbare durchschnittliche 
Mindest-Intensitat des Signals. Dabei sollte die Mindest- 
Haufigkeit mindestens 50%, insbesondere mindestens 70%, 
vorzugsweise mindestens 90%, beu-agen. Die Ermittlung 
der empirischen Signale durch Vergleich gemessener Mas- 
senspektren kann visuell, vorzugsweise jedoch computerge- 
stiitzt, durchgefuhrt werden. Entsprechende Algorithmen 
(Mustererkennungsverfahren) sind bekannt und sollen hier 



nicht naher erlauten werden. Die Anzahl der Signale eines 
Referenzspektrums betragt vorteilhafterweise 5 bis 30. In 
praktischen Versuchen hat sich insbesondere eine Anzahl 
von 10 bis 15 als ausreichend erwiesen. Es ist femer bevor- 

5 zugt vorgesehen, dass ein Signal eines synthetischen Refe- 
renzspektrums durch lediglich ein Koordinatenpaar repra- 
sentien wird. Dabei besteht das Koordinatenpaar aus einer 
Masse beziehungsweise einem Masse-Ladungs-Verhallnis 
als x-Koordinate einerseits und einer absoluten oder relati- 

10 ven Intensitat als y-Koordinate andererseits. Verglichen mil 
"naturlichen" Massenspektren, die etwa 16000 Datenpunkte 
enthalten, bedeutet dies eine erhebliche Datenreduktion. Fur 
den Abgleich eines Probespektrums mit den Referenzspek- 
tren der Datenbank konnen vorteilhafterweise den einzelnen 

15 identifizierten und empirischen Signalen der synthetischen 
Referenzspektren Gewichtungen entsprechend ihrer Signifi- 
kanz zugeordnet werden. 

[0011] Die Erfindung umfasst femer eine Datenbank, die 
mit dem erfindungsgemaBen Verfahren erstellt wurde, sowie 

20 die Verwendung der Datenbank fur die Identifizierung von 
Mikroorganismen mittels MALDI-TOF-MS. 
[0012] Die Erfindung wird nachfolgend in Ausfiihrungs- 
beispielen anhand der zugehorigen Zeichnungen naher er- 
lautert. Es zeigen: 

25 [0013] Fig. 1 ein Ablaufschema einer typischen Ausfuh- 
rung des erfindungsgemaBen Verfahrens; 
[0014] Fig, 2 MALDI-TOF-Massenspeklren von Escheri- 
chia coli und von isolierten Ribosomen aus Escherichia coli 
und 

30 [0015] Fig. 3 bis 6 synthetische ReferenzspekU:en von 
zwei Escherichia-coli-Stammen sowie zwcicr Klcbsiclla- 
Spezies. 

[0016] Fig. 1 zcigt in einem FHeBschema einen typischen 
erfindungsgemaBen Verfahrcnsablauf. In einem erstcn 
35 Schritt SI wird cine m5glichst groBe Anzahl von Referenz- 
spektren REF bekannter Mikroorganismen gemcssen. Im 
Folgenden werden einige Details zur Probenvoibereitung 
und zur Datenakquisition gegeben. 

40 Probenvorbercitung und MALDI-TOF-Datenakquisition 

[0017] Fiir eine MALDI-TOF-Analyse werden zirka 5 bis 
100 pg Nasszellen oder auch 5 bis 50 pg getrocknete Zellen 
eines bekannten oder zu identifizierenden Bakteriums oder 

45 Pilzes benotigt. Eine Vorbehandlung der Zellen, beispiels- 
weise ein Zellaufschluss, ist nicht notwendig. Die Nasszel- 
len konnen entweder direkt von einer AGAR-Kultur mit ei- 
ner steriien Impfose auf eine auch Template genannte Pro- 
benplatte uberu^gen werden. Altemativ konnen auch abzen- 

50 trifugierte Zellen einer Flussigkultur verwendet werden. 
AnschlieBend werden die Zellen auf der Probenplatte mit 
0,2 bis 1 \il einer Mattixlosung vermischt. In Abwandlung 
von dieser Prozedur konnen die Nasszellen auch vor ihrer 
Obertragung auf die Probenplatte mit der MaUixlosung ver- 

55 mischt und als Suspension ubertragen werden. Fiir die fol- 
genden Messungen wurde eine Matrixlosung aus 100 mg/ml 
2,5-Dihydroxybenzoesaure in einer Mischung aus 50% 
Acetonitril und 50% Wasser mit 3% Trifluoressigsaure ver- 
wendet. Andere bekannte MaUixlosungen sind ebenfalls ge- 

60 eignet. Nach Trocknung der Probe, die mit einer Kristallbil- 
dung einhergeht, kann die Probe direkt einer MALDI-TOF- 
massenspekU'ometischen Analyse unterworfen werden. Fiir 
die vorliegenden Messungen wurde jeder Probenpunkt einer 
Probenplatte in einem herkommlichen MassenspekU-ometer 

65 mit zirka 50 bis 300 Laserpulsen eines Stickstoff-Lasers mit 
einer Wellenlange von 337 nm angeregt. Die Akquisition 
positiver lonenmassenspektren erfolgte im Linearmessmo- 
dus in einem Massenbereich von 2000 bis 20000 m/z. Ein 
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typisches Beispiel eines auf diese Weise erhaltenen positi- 
ven MALDI-TOF-Massenspektrums REF von Escherichia 
coli ist im oberen Teil der Fig, 2 im Massenbereich von 
zirka m/z = 4000 bis 14000 dargestellt. 
[0018] Im anschlieBenden Schritt S2 (Fig. 1) wird eine Pe- 5 
akzuordnung zu beslimmten molekularen Zellbestandteilen 
durchgefiihrt. Eine mogliche Vorgehensweise, die auf be- 
kannte Methoden der Biochemie und Molekularbiologie zu- 
riickgreift, wird im Folgenden am Beispiel von Ribosomen- 
proteine der grofien Ribosomenunteieinheit kurz erlautert. LO 

Identifizierung unbekannter Signale 

[0019] Ein Proteinextrakt einer Zellkultur wird mittels ei- 
ner 2I>Gelelektrophorese aufgetrennt. In Frage kommende 15 
sogenannte Proteinspots werden anschliefiend einem trypti- 
schen Verdau, bei dem das Protein enzymatisch in kleine 
Proteinbruchstucke gespaltet wird, unterzogen. Sofem Anti- 
k5rper gegen Ribosomen vorhanden sind, konnen die rele- 
vanten Proteinspots auch durch ein Immunoassay (zum Bei- 20 
spiel Western-Blot- Analyse) erkannt werden. Die durch den 
tryptischen Verdau gewonnen Proteinbruchstucke werden 
dann mittels einer HPLC, die fur besonders kleine Proben- 
mengen geeignet ist, aufgetrennt und ansequenziert. Mit den 
auf diese Weise ennilLeiten Sequenzbruchstiicken kann dann 25 
versuchl werden, die Ribosoniengene in einer Datenbank zu 
identifizieren. Sind enlsprechende Gene in der Dalenbank 
vorhanden, kann aus der gesamlen Gensequenz die korre- 
spondierende Proteinmasse ermittelt werden. Kann ein ent- 
sprechendes Gen in der Datenbank nicht gefunden werden, 30 
so muss mit bckanntcn Mittcln der Molekularbiologie, die 
hier nicht naher ausgefiihrt werden sollen, das gesamte Gen, 
welches fur das cntsprcchcndc ribosomalc Protein kodiert, 
isoiicrt und scqucnzicrt werden. Ist die Gensequenz be- 
kannt, folgl die Ubcrsctzung in die Proteinsequenz und Er- 35 
mittlung der thcorctischen Proteinmasse. Eine tfberprufung 
dieser theoretischen Masse kann erfolgen, indem der enl- 
sprechende Proteinspot der 2D-GelelekU'ophorcsc einer 
MALDI-TOF-MassenspektromeUie unterworfen wird. Bei 
Abweichungen von der theoretischen Proteinmasse konnen 40 
Modifikationen des Proteins durch MALDI-TOF-Analyse 
des tryptischen Verdaus festgestellt werden. 
[0020] Zur Verdeutlichung ist in der Fig. 2 im unteren Teil 
ein Massenspektrum des 70S-Ribosomens aus Escherichia 
coli, das mittels 2D-GelelekU:ophorese isoliert wurde, dar- 45 
gestellt. Mit 70S wird der gesamte Ribosomen eines Pro- 
teins bezeichnet, der sich aus der groBen 50S-Untereinheit 
und der kleinen 30S-Untereinheit zusammensetzt. Beide 
Untereinheiten bestehen ihrerseits aus einer Reihe von Pro- 
teinen, die mit dem Buchstaben L (fiir large) und dem Buch- 50 
staben S (fur small) bezeichnet werden. Es ist ohne Weiteres 
ersichtlich, dass eine Reihe der intensivsten Signale aus dem 
Spektrum von Escherichia coli (vgl. Fig. 2 oberer Teil) sich 
auf ribosomale Proteine zuriickfuhren lassen. Enlspre- 
chende Signale sind in der Abbildung mit Pfeilen gekenn- 55 
zeichnet. Den Erfindem ist es erstmalig gelungen, drei die- 
ser Signale bestimmten Proteinen der groBen 50S-Riboso- 
menuntereinheit zuzuordnen. Dabei handelt es sich um die 
Proteine L29, L30 und L36 mit den Massen m/z = 7274, 
6412 und 4364, Da diese Signale mit einer hohen Zuverlas- 60 
sigkeit in den Massenspektren von Escherichia coli auftau- 
chen, sind sie besonders zur Identifizierung geeignet. Sie 
wurden als identifizierte Signale S^i fur das synthetische Re- 
ferenzspektrum REFs fur Escherichia coli verwendet. 
[0021] In einem altemativen oder zusatzlichen Schritt S3 65 
(Fig. 1) werden empirische Signale Sem aus den gemessenen 
Referenzspektren REF der bekannten Mikroorganismen er- 
mittelt. Die Ermittlung der empirischen Signale Sem erfolgt 
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durch Vergleich einer Vielzahl von Massenspektren, die von 
demselben Stamm aufgezeichnet wurden, untereinander so- 
wie durch Vergleich dieser Massenspektren mit denen von 
anderen Organismen. Dabei werden solche Signale als cha- 
rakteristisch fiir einen Mikroorganismus ermittelt, die mog- 
lichst haufig in den Massenspektren desselben Organismus 
auftauchen und moglichst selten in den MassenspekUren ei- 
nes anderen. Fiir die Haufigkeit eines Auflretens eines ge- 
eigneten empirischen Signals Sem dabei ein Mindest- 
Wert, beispielsweise > 70% bezogen auf alle Spektren eines 
Organismus, vorgegeben werden. Ebenso soUte ein solches 
Signal eine vorgebbane Mindest-Inlensitat besitzen, um 
seine Unterscheidung von dem Unteigrundrauschen zu er- 
leichtern. Die Ermittlung der empirischen Signale Sem im 
Schritt S3 kann durch visuellen Spektrenvergleich durch 
den Anwender erfolgen. Es ist jedoch bevorzugt vorgese- 
hen, diesen Schritt automatisiert mit Hilfe geeigneter Rech- 
nerprogramme durchzufiihren. Hier kommt etwa ein Algo- 
rithmus in Frage, welcher die gemessenen Referenzspektren 
REF hinsichdich der genannten Kriterien untersucht. Es 
sind jedoch auch, beispielsweise aus der Infrarotspektrome- 
trie, computergestutzte Verfahren bekannt, die unter An- 
wendung statislischer Algorithmen in der Lage sind, wie- 
derkehrende Signale zu erkennen und herauszufiltem. 
[0022] Die in den Schritten S2 und S3 ermiltelten idenlifi- 
zierten und empirischen Signale Sid, Sem werden in einem 
anschlieBenden Schritt S4 zu synthetischen Referenzspek- 
tren REFs zusammengefassl. Dabei wird fiir jeden bekann- 
ten Mikroorganismus ein Referenzspektrum REFs erzeugt. 
In den Fig. 3 bis 6 sind beispielhaft derartige synthetische 
Referenzspektren REFs fur zwei Eschcrichia-coli-Stanune 
(ATCC 25922 und ATCC 35218) und zwei KlebsieUa-Spe- 
zies - namlich Klebsiella pneumoniae und Klebsiella oxy- 
coca - dargestellt. Dabei ist jeweils im oberen Teil jcder der 
Fig. 3 bis 6 das synthedschc Referenzspektrum REFs in Ko- 
ordinatcnform dargestellt, wahrend im untcrcn Teil jeweils 
die graphische Reprasentation in der typischen Form von 
Massenspektren abgcbildet ist. Die synthetischen Referenz- 
spektren REFs umfassen in den gezeigten Beispielen elf bis 
vierzehn Signale S. Dabei sind in den Escherichia-coli-Re- 
ferenzspektren REFs die als die Proteine L29, L30 und L36 
der groBen 50S-Ribosomenuntereinheit von Escherichia 
coli .identifizierten Signale Sid markiert. Diese Signale Sid 
tauchen in beiden Stammen von Escherichia coli auf. Sie 
eignen sich zur Identifizierung der Art und zur Abgrenzung 
gegeniiber Klebsiella-Spezies, in denen nur ein Teil der 
identifizierten Signale Sij vorkommt. Insbesondere wird bei 
Klebsiella (Fig. 5 und 6) das Signal mit der Masse m/z = 
6413 nicht beobachtet. Die Unterscheidung der beiden 
Escherichia-coli-Slamme (Fig, 3 und 4) wird durch solche 
empirische Signale Sem ermoglicht, die nur bei einem von 
beiden beobachtet werden. Ein Vergleich der in den Fig, 3 
und 4 gezeigten synthetischen Referenzspektren REFs zeigt, 
dass das erfindungsgemaBe Verfahren empfindlich genug 
ist, um eine Unterscheidung von Mikroorganismen sogar 
auf Stammniveau zu ermoglichen. Daneben wird auch eine 
Unterscheidung zwischen Escherichia coli einerseits und 
Klebsiella-Spezies andererseits ermoglicht. 
[0023] Die in dem Schritt S4 (Fig. 1) erzeugten syntheti- 
schen Referenzspektren REFs werden in einem anschlie- 
Benden Schritt S5 zu einer Datenbank DB zusammenge- 
fassl. Innerhalb der Datenbank DB konnen die syntheti- 
schen Referenzspektren REFs in logischer Weise, beispiels- 
weise nach Familie, Gattung, Art und Stamm, geordnet wer- 
den. Der Verfahrensablauf von SI bis S5, das heiBt die Er- 
stellung der Datenbank DB, muss prinzipiell nur einmal 
durchgefiihrt werden. Auf diese Datenbank DB kann dann 
bei den anschlieBenden Schritten immer wieder zuriickge- 
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grifFen werden. Selbstverstandlich sollte die Datenbank DB 
standig durch Referenzspektren R£Fs weiterer Mikioorga- 
nismen erweitert und aktualisiert werden. So isl etwa denk- 
bar, Referenzspektren REFs von Mutanten, insbesondere 
solchen mil verandertem Resistenz- und/oder Virulenzver- 5 
halten, aufzunehmen, sofem diese Stamme charakteristische 
Signale liefem. Auch soUten auf Basis statistischer Auswer- 
tung der analysierten Proben die vorhandenen Referenz- 
spektren REFs laufend optimiert werden, beispielsweise 
durch die Aufnahme neuer Signale Sid, ^em und/oder durch to 
Loschung von Signalen. 

[0024] In dem Schritt S6 erfolgt dann die Akquisition ei- 
nes Massenspektrums eines zu identifizierenden Mikroorga- 
nismus. Vorteilhafterweise wird dieses Proben spektrum 
SAM unter moglichst identischen Messbedingungen, insbe- 15 
sondere gleicher Matrix, wie die Referenzspektren REF in 
Schritt SI gemessen. Nachfolgend (Schritt S7) erfolgt eine 
Ahnlichkeitsanalyse des Probenspektrums SAM mit den in 
der Datenbank DB enthaltenen synthetischen Referenzspek- 
U:en REFg. Auch dieser Spektrenabgleich kann visuell, vor- 20 
zugsweise jedoch computergestutzt, erfolgen. Dabei kann 
prinzipiell auf die gleichen oder ahnliche Algorithmen zu- 
riickgegriffen werden, die bereits in Schritt S3 zur Emiitt- 
lung der empirischen Signale Scm Anwendung fanden. 
Durch die Einfachheit der verwendeten Referenzspektren 25 
REFs kann der SpekU-enabgleich in Schritt S7 auch mit sehr 
einfachen Algorithmen durchgeflihrt werden, die sich ledig- 
lich auf einen Vergleich der Signale Sid, ^tm der syntheti- 
schen Referenzspekuren REFs beschranken. Selbstverstand- 
lich miissen hier Toleranzkriterien vorgegeben werden, die 30 
fcstlcgcn, um wie vicl cin in Frage kommcndes Signal Sid, 
Scm des ProbenspekUrums SAM hinsichtlich der Masse und/ 
odor der Intcnsitat abweichcn darf, um als ubcrcinstimmcnd 
gewcrtet zu werden. Fcmer sollte eine Mindcst-Anzahl 
iibcrcinstinimcndcr Signale fiir cine Idcntifizicning vorge- 35 
gcbcn werden. Im Schritt S8 erfolgt eine Ausgabe cines Rc- 
sultats. Dieses kann entweder darin bestehen, dass eine 
Ubercinstimmung des Probcnspckuums SAM mit cincm der 
ReferenzspekU-en REFs crkannt wurde. Femer kann auch 
eine Information iiber den Grad der Ubercinstimmung aus- 40 
gegeben werden. Handelt es sich - wie haufig der Fall - bei 
der Ptobe des unbekannten Organismus um eine Mischkul- 
lur, so ermoglicht das Verfahren sogar die Identifizierung 
mehrerer, nebeneinander vorliegender Mikrooiganismen. In 
einem solchen Fall werden als Eigebnis mehrere TVeffer 45 
ausgegeben. Sdmmt das Probenspektrum SAM mit keinem 
der synthetischen ReferenzspekU-en REFs innerhalb der zu- 
gelassenen Toleranzen uberein, das heiBi, der unbekannte 
Mikroorganismus ist nicht in der Datenbank DB enthalten, 
so ist auch dieses ein ausgebbares Resultat, 50 
[0025] In bestiimnten Fallen, in denen ein Mikroorganis- 
mus nicht Oder nicht eindeutig identifiziert werden kann, 
kann vorteilhaft voigesehen sein, dass im Anschluss an den 
Schritt S7 ein zusatzlicher Direktveigleich mit den gemesse- 
nen "naturlichen" Referenzspektren REF durchgeflihrt wird. 55 
Dieses Vorgehen entspricht der bekannten Vorgehensweise 
zur Identifizierung von Mikroorganismen mittels MALDI- 
TOF-MS. 

[0026] Durch die Einfachheit und den konzentrierten In- 
formationsgehalt der synthetischen Referenzspektren REFs 60 
zeichnet sich das erflndungsgemaBe Verfahren durch eine 
wesendich hohere Zuverlassigkeit aus. 

Bezugszeichenliste 

65 

5 1 Messung von Referenzspektren 

52 Signalidentifizierung 

53 Ermittlung empirischer Signale 



54 Erzeugung eines synthetischen Referenzspektrums 

55 Datenbankerstellung 

56 Erfassung eines Probenspektrums 

57 Spektrenabgleich 

58 Ergebnisausgabe 
Sid identifiziertes Signal 
Sem empirisches Signal 

REF gemessenes Referenzspekuum 
REFs syndietisches Referenzspektrum 
DB Datenbank 
SAM Probenspektrum 
RES Ergebnis 

Patentanspriiche 

1. Verfahren zur Identifizierung von Mikrooiganismen 
mittels Matrixassisted-Laser-Desorption-Ionisation- 
Time-of-Flight MassenspekUromeUie (MALDI-TOF- 
MS), wobei 

eine Datenbank mit Referenzspektren, bestehend aus 
Massenspektren einer Anzahl bekannter Mikroorganis- 
men, erstellt wird, 

ein MALDI-TOF-MassenspekUaim (ProbenspekU*um) 
einer Probe eines zu identifizierenden Mikroorganis- 
mus aufgenommen wird, 

eine Ahnlichkeitsanalyse des MassenspekUiims des zu 
identifizierenden Mikroorganismus mit den in der Da- 
tenbank enthaltenen Referenzspektren durchgeflihrt 
wird, 

dadurch gckcnnzcichnct, dass als Referenzspektren 
(REF) synthctischc MasscnspekUxin (REFs) verwendct 
werden, die durch Zusammenfassung einer gegeniiber 
natiirlichen Massenspektren rcduzicrten Anzahl von 
fiir den jeweiligen Mikroorganismus spczifischcn Si- 
gnalen (S) crzeugt werden. 

2. Verfahren nach Anspruch 1, dadurch gekennzeich- 
net, dass die Signale (S) eines synthetischen Referenz- 
spekUums (REFs) mindestcns cin identifiziertes Signal 
(Sid) umfassen, welches einem einzelnen molekularen 
Zlellbestandteil des jeweiligen Mikroorganismus zuge- 
ordnet wurde. 

3. Verfahren nach Anspruch 2, dadurch gekennzeich- 
net, dass der Zellbestandteil ein Peptid, ein Protein, 
eine Ribonukleins^ure und/oder ein Lipid ist. 

4. Verfahren nach einem der Anspriiche 2 oder 3, da- 
durch gekennzeichnet, dass der Zellbestandteil ein ri- 
bosomales Protein, insbesondere ein Protein der gro- 
Ben Ribosomenuntereinheit ist. 

5. Verfahren nach einem der vorhergehenden Ansprii- 
che, dadurch gekennzeichnet, dass die Signale (S) ei- 
nes synthetischen Referenzspektrums (REFs) minde- 
stens ein empirisches Signal (Sem) umfassen, welches 
durch Vergleich von Massenspektren bekannter Mi- 
kroorganismen als spezifisch fur einen Mikrooiganis- 
mus ermittelt wurde. 

6. Verfahren nach Anspruch 5, dadurch gekennzeich- 
net, dass der Vergleich visuell und/oder computerge- 
stutzt durchgeflihrt wird. 

7. Verfahren nach einem der Anspriiche 5 oder 6, da- 
durch gekennzeichnet, dass als Kriterien zur Ermitt- 
lung eines empirischen Signals (Send eine vorgebbare 
Mindest-Haufigkeit fiir ein Auftreten des Signals in ei- 
ner Anzahl von Massenspektren des selben Mikrooiga- 
nismus und eine vorgebbare Mindest-Intensitat des Si- 
gnals vorgegeben werden. 

8. Verfahren nach einem der vorhergehenden Ansprii- 
che, dadurch gekennzeichnet, dass ein Signal (S) durch 
ein Koordinatenpaar, bestehend aus einer Masse (m) 
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Oder einem Masse-Ladungsverhaltnis (m/z) als x-Ko- 
ordinate und einer absoluten oder relativen Intensitat 
als y-Koordinate, reprasentiert wird. 

9. Verfahren nach einem der vorhergehenden Ansprii- 
che, dadurch gekennzeichnet, dass die Anzahl der Si- 5 
gnale (S) eines synthetischen Referenzspektruras 
(REFs) 5 bis 30, insbesondere 10 bis 15, betragt. 

10. Verfahren nach einem der vorhergehenden An- 
spriiche, dadurch gekennzeichnet, dass die Aufnahme 
der Massenspektren von nicht vorbehandelten Zellen lo 
durchgefiihrt wird. 

11. Verfahren nach einem der vorhergehenden An- 
sprCiche, dadurch gekennzeichnet, dass die Ahnlich- 
keiLsanalyse des Massenspektrums des zu identifizie- 
renden Mikroorganismus mit den in der Datenbank 15 
(DB) enthaltenen Referenzspektren (REFs) sich auf ei- 
nen Vergleich der in den Referenzspektren (REF) ent- 
haltenen Signale (S) beschrankt. 

12. Verfahren nach einem der vorhergehenden An- 
spriiche, dadurch gekennzeichnet, dass fur die Ahnlich- 20 
keitsanalyse den in den Referenzspektren (REFs) ent- 
haltenen Signalen (S) Gewichtungen zugeordnet wer- 
den. 

13. Datenbank, erhaltlich durch ein Verfahren nach ei- 
nem der Anspriiche 1 bis 12. 25 

14. Verwendung einer Datenbank nach Anspruch 13 
fiir die Identifizierung von Mikrooiganismen mittels 
MALDI-TOF-MS. 
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DE10038694A - Title / Abstract 



Identification of micro-organisms, using MALDI-TOF-MS, uses a synthetic reference spectmm for comparison 
with the mass spectrum to register the micro-organism understudy 

Identifying micro-organisms uses matrix assisted laser desorption ionization/time of flight/mass spectrometry 
(MALDI-TOF-IVIS). is new. 

A database (DB) of reference spectra has mass spectra of some known micro-organisms. 

The reference spectrum (REF) uses synthetic reference spectra (REFS), which gather a reduced number of 
specific signals for a given micro-organism compared with natural mass spectra. 

Identifying micro-organisms by MALDI-TOF-MS, the signals from a synthetic reference spectrum contain at least 
one identification signal (Sid) relating to a single molecular cell component of each micro-organism. 

The molecular cell component is a peptide, protein 

, a ribonucleic acid (RNA) and/or a lipid, a ribosomal protein and especially a protein of a large ribosome sub-unit. 

The signals from a synthetic reference spectrum contain at least one empirical signal (Sem), specific for a given 
micro-organism, through comparison of the mass spectra of known micro-organisms. 

The comparison Is visual and/or computer assisted. 

The criteria for the generation of an empirical signal are a given minimum frequency for the presence of a signal 
in a number of mass spectra for the same micro-organism, and a given minimum signal intensity. 

A signal Is represented by a pair of coordinates composed of a mass or a mass/charge ratio as the X-coordinate, 
and an absolute or relative intensity as the Y-coordinate. 

The synthetic reference spectrum gives 5-30 signals and preferably 10-15. 

The mass spectra are registered from cells which have not been prepared. 

The analysis of the similarity of the mass spectra of the micro-organisms to be identified with the reference 
spectra stored In the database is restricted to a comparison of the signals contained in the reference spectra. 



The analysis of the similarity of the signals in the reference spectra uses weighting. 



Claims: 

1 . Procedure for the identification of micro organisms by means of Matrixassisted laser desorption ionization time 
OF Flight mass spectrometry (MALDI TOF ms), how 

a data base with reference spectra, consisting of mass spectra of a number of well-known micro organisms, is 
provided. 

a MALDI TOF mass spectrum (sample spectrum) of a sample one is taken up microorganism which can be 
identified, 

a similarity analysis of the mass spectrum of the microorganism with the reference spectra, contained which can 
be identified, in the data base is accomplished, 

is characterized by that as reference spectra (REF) synthetic mass spectra (REFS) are used, which reduced 
opposite natural mass spectra by summary number of signals (s) specific for the respective microorganism are 
produced. 

2. Procedure according to claim 1, is characterized by that the signals (s) of a synthetic reference spectrum 
(REFS) cover at least an identified signal (simmer), which was assigned to an individual molecular cell component 
of the respective microorganism. 

3. Procedure according to claim 2, is characterized by that the cell component is a Peptid, a protein, a 
Ribonukleinsaeure and/or a Lipid. 

4. Procedure after one of the claims 2 or 3, is characterized by that the cell component is a ribosomales protein, in 
particular a protein of the large Ribosomenuntereinheit. 

5. Procedure after one of the preceding claims, is characterized by that the signals (s) of a synthetic reference 
spectrum (REFS) cover at least an empirical signal (Sem), which micro organisms well-known by comparison of 
mass spectra as specific for a microorganism were determined. 

6. Procedure according to claim 5, is characterized by that the comparison is accomplished visually and/or 
computer-assisted. 

7. Procedure after one of the claims 5 or 6, Is characterized by that as criteria for the determination of an empirical 
signal (Sem) a minimum frequency given in advance for an occurrence of the signal in a number of mass spectra 
of the same microorganism and a minimum intensity given in advance of the signal are given. 



8. Procedure after one of the preceding claims, is characterized by that a signal (s) is represented by a pair of 
coordinates, consisting of a mass (m) or a mass charge relationship (m/z) as x-coordinate and an absolute or 
relative intensity as Y-coordinate. 

9. Procedure after one of the preceding claims, is characterized by that the number of signals (s) of a synthetic 
reference spectrum (REPS) amounts to 5 to 30, in particular 10 to 15. 

10. Procedure after one of the preceding claims, is characterized by that the admission of the mass spectra of not 
pre-treated cells is accomplished. 

11. Procedure after one of the preceding claims, is characterized by that the similarity analysis of the mass 
spectrum of the microorganism with the reference spectra (REFS), contained which can be identified, in the data 
base (railways), limited to a comparison of the signals (s) contained in the reference spectra (REF). 

12. Procedure after one of the preceding claims, is characterized by that for the similarity analysis weightings are 
assigned to the signals (s) contained in the reference spectra (REFS). 

13. Data base, available by a procedure after one of the claims 1 to 12. 

14. Use of a data base after claim 13 for the identification of micro organisms by means of MALDI TOF ms. 



Description: 

The invention concerns a procedure for the identification of micro organisms by means of matrix assisted laser 
desorption ionization Time OFFIight mass spectrometry (MALDI TOF ms) with the characteristics specified in the 
generic term of the claim 1 as well as in the procedure provided and for the procedure usable data base. 

A fast and reliable Identification from micro organisms is in different ranges of the health service, for example the 
diagnostics of infections, as well as the foodstuffs industry of crucial importance. The traditional identification by 
means of the direct bacteria proof requires first the Anzuechtung of the micro organisms from a sample of a 
material, which can be identified. Following microscopic investigation procedures serve mainly provisional 
orientation over the bacteria content as well as the micro morphology and/or coloring characteristics of the clinical 
investigation sample. The identification from Isolaten to the species level requires pretty often a Subkultivierung 
for the production of a pure culture. In the classical identification procedure of the medical microbiology using a 
suitable combination of differential media (so-called "multicolored row"), specific metabolic achievements of the 
microorganism which can be identified are finally seized. Hauptnachteil of the mikroblellen procedure is its very 
high time requirement. More modern molecular-biological beginnings, like the PGR method (polymerase nuclear 
chain reaction) and the 16S-rRNA method, involve the genetic analysis of the gene COM and/or certain 
Ribonukleinsaeuren isolated before. These procedures gained because of their high sensitivity strongly 
significance. They require a cultivation of the organisms in the laboratory just like the micro-biological 
characterisation and are beyond that loaded with a substantial personnel and instrumental expenditure. 
Furthermore a infrared-spectroscopic procedure was developed, with that vibration spectra of intact cells ("finger 
print spectra") in FTIR spectrometers is noted and with a data base with vibration spectra of well-known micro 



organisms adjusted. This still very new technology still is in the development and can be accomplished at present 
only by particularly trained and experienced personnel, so that this beginning could not become generally 
accepted yet in practice. 

With the so-called MALDI TOP Massenspektrometrie in the last years a procedure was developed, which is 
accessible to the analysis of biological macromolecules contrary to conventional measure-spectrometric 
procedures also. With the MALDI TOP Ms technology the sample with a usually crystalline organic compound, to 
the so-called matrix, which can be examined, is given on a Probenplatte, whereby the sample is built into the 
matrix crystals, and brought with a laser beam in reciprocal effect. Individual molecules of the sample are 
desorbed and ionized by the sample carrier. Subsequently, in such a way produced ions in an electrical field are 
accelerated and its flying time (time OF Flight) up to reaching a detector is registered. Since acceleration depends 
on the mass of an ionized molecule, the flying times reflect the molecule masses existing in the sample. The 
MALDI TOP Ms technology finds nowadays mainly in the area of protein analytics ("Proteomics") and with the 
RNA and DNA analytics application. It was suggested using the method for the identification of micro organisms 
into analogy to the infrared-spectroscopic finger print method described above. But the MALDI TOP mass 
spectrum of a cell excerpt or intact cells (for example WHERE 98/09314) of the unknown microorganism is 
compared with the spectra of well-known organisms. The comparison of the sample spectrum with the reference 
spectra of the data base takes place usually computer-assisted by means of statistic-mathematical algorithms, 
which were developed in so-called pattern recognition procedures. The mass spectra resemble each other 
increasing with increasing relational proximity of the micro organisms. That is, the probability of a repetition of 
certain signals in the mass spectra increases. Therefore the procedure is with superordinate classification levels, 
approximately at kinds or families, with a increased uncertainty connected, if an allocation on master level fails, 
for example because no reference spectrum of the trunk in the data base is present. The procedure is dependent 
therefore on very extensive data bases with a multiplicity of representative reference spectra of well-known 
trunks. In addition the difficulty comes to discriminate against a spectral background noise from genuine signals 
to. 

Task of the present invention is it therefore to develop further would genericin accordance with-eat MALDI TOF 
Ms procedures for the identification of micro organisms going by that its reliability is increased, without the 
necessary process expenditure to increase. It is furthermore in the procedure provided and for the procedure 
applicable data base to be made available. 

This task is solved by a procedure with the characteristics of the claim 1 as well as by a data base and its use 
after the Claims 13 and 14. 

Procedure in accordance with it is Intended that as reference spectra synthetic mass spectra are used, which 
reduced natural" (did not reduce) mass spectra by summary of one opposite "number of signals specific for the 
respective microorganism are produced. By the reduction of the reference spectra on a relatively small number of 
characteristic signals, a substantial data and Infomnation reduction are reached. Not only storage location is saved 
by the data reduction, but also a temporal expenditure for data communication, so that the procedure also in 
principle for an application over interiaced data-processing systems (e.g. Internet) is suitable. Beyond that the 
information reduction of the reference spectra makes a clear acceleration of the similarity analysis of the mass 
spectrum of the microorganism with the reference spectra, which can be identified, for the data base possible, 
since the analysis can be limited now to a comparison of the signals contained in the reference spectra. 



Compared to conventional procedures, in which a sample spectrum of the organism with "natural" reference 
spectra, which can be identified, is adjusted, is a reliability of the procedure according to invention, i.e. the 
probability, a correct allocation of the unknown organism to meet, clearly increases. Herein the bedeutendeste 
advantage of the invention is to be seen. The increased reliability is to be explained by the high concentration of 
specific information in the reference spectra, which is not covered by signals of small significance or noise. Also 
with a possible failure with an allocation on master level of a sample, about because no reference spectrum of this 
trunk is available in the data base, the procedure supplies reliable identification on superordinate classification 
levels, for example on generic or kind level. The sensitivity of the proceeding according to invention is also not 
impaired by differences in different spectra, which are caused for example by different cultivation conditions, 
different cell stages or deviating signal of intoxication conditions. 

A further advantage of the procedure represents the small necessary sample quantity of the microorganism which 
can be identified, which is available in shorter cultivation times. Furthermore also Mischkulturen can be analyzed, 
so that without the rearing of pure cultures can be done. 

The signals contained in the synthetic reference spectra can be differentiated with respect to two categories. A 
particularty favourable arrangement of the invention plans that the signals of a reference spectrum cover at least 
an identified signal, which was clearly assigned to a characterized molecular cell component of the respective 
microorganism. For the identification of a microorganism suitable cell components are for example certain 
Peptide, proteins, Ribonukleinsaeuren and/or Lipide. As particularly favourable, a signal allocation of a 
ribosomalen protein, in particular a protein of the large Ribosomenuntereinheit proved to make. For bacteria this 
proteins of the so-called 50S-Untereinheit are and with mushrooms the 60S subunit. Proteins represent a main 
part of mikrobieller cells. This applies in particular for Ribosomenproteine, which are Independently of a 
development stage of the celt, a nutrient offer or other cultivation conditions constantly present and thus reliable 
signals In the mass spectra represent. In addition it comes that amino acid sequences of similar proteins of 
different species or even different trunks differ at least slightly from each other. Therefore the similar proteins 
exhibit different masses and are suitable for their distinction. Thus the allocation of three mass signals in the mass 
spectrum of Escherichia succeeded to the inventors for example for the first time coll (m/z = 4365, 6413, 7276) at 
the proteins L29, L30 and L36 of the large 50S-Ribosomenuntereinheit. These signals are constant components 
in mass spectra of E. coli, not however from most other micro organisms. They are suitable therefore particularly 
for the identification by Escherichia coll and for the admission into a synthetic reference spectrum for E. coli. 

In further training of the present invention It Is Intended that the signals of a synthetic reference spectrum cover an 
empirical signal, which micro organisms well-known by comparison of a multiplicity of mass spectra as specific for 
a microorganism was determined as the second signal category at least. It concerns signals, whose origin, i.e. 
their causing molecular cell component do not admit, are, which are rated however due to certain criteria as 
characteristic for a microorganism. Preferably these criteria cover a minimum frequency given in advance for the 
occurrence of a signal in a number of mass spectra of the same microorganism as well as an average minimum 
intensity given In advance of the signal. The minimum frequency should amount to at least 50%, in particular at 
least 70%, preferably at least 90%. The determination of the empirical signals by comparison of measured mass 
spectra can be accomplished visually, preferably however computer-assisted. Appropriate algorithms (pattern 
recognition procedures) are well-known and are not more near to be described here. The number of signals of a 
reference spectrum amounts to favourable-proves 5 to 30. In practical attempts in particular a number from 10 to 
15 proved as sufficient. Furthermore it Is preferentially intended that a signal of a synthetic reference spectrum Is 
represented by only a pair of coordinates. The pair of coordinates consists mass charge of a mass and/or a 



relationship as x-coordinate on the one hand and an absolute or relative intensity as Y-coordlnate on the other 
hand. Compared to "natural" mass spectra, which contain about 16000 data points, this means a substantial data 
reduction. For the alignment of a sample spectrum with the reference spectra of the data base favourable-prove 
to the individual identified and empirical signals of the synthetic reference spectra weightings can according to 
their significance to be assigned. 

Furthermore the invention covers a data base, which were provided with the procedure according to invention, as 
well as the use of the data base for the identification of micro organisms by means of MALDI TOF ms. 

The invention is more near described in the following in remark examples on the basis the associated designs. 
Show: 

Fig. 1 a flow chart of a typical execution of the procedure according to invention; 

Fig. 2 MALDI TOF mass spectra of Escherichia coli and of Isolated Ribosomen from Escherichia coll and 

Fig. 3 to 6 synthetic reference spectra of two Escherichia coli trunks as well as two Klebsiella species. 

Fig. 1 shows a typical operational sequence according to invention in a flow chart. In a first step S1 a if possible 
large number of reference spectra REF of well-known micro organisms is measured. In the following some details 
are given for sample preparation and for data acquisition. 

Sample preparation and MALDI TOF Datenakquisition 

For an MALDI TOF analysis 5 to 100 mu g wet cells or also 5 to 50 mu g dried cells of a well-known or bacterium 
or mushroom which can be identified are zirka needed. A pretreatment of the cells, for example a cell explanation, 
is not necessary. The wet cells can be transferred either directly by a agar culture with a sterile inoculation eye to 
one also Template Probenplatte specified. Alternatively cells of a liquid culture also abzentrifugierte can be used. 
Subsequently, the cells on the Probenplatte are mixed with 0,2 to 1 mu I of a matrix solution. Into modification of 
this procedure the wet cells can be mixed also before their transmission to the Probenplatte with the matrix 
solution and transferred as suspension. For the following measurements a matrix solution from 100 mg/ml 2,5- 
Dihydroxybenzoesaeure was used in one mixture from 50% acetonitrile and 50% water with 3% tri fluorine acetic 
acid. Other well-known matrix solutions are likewise suitable. After drying process of the sample, which 
accompanies with a crystallization, the sample can be subjected directly to a MALDI TOF 
massenspektrometischen analysis. For the available measurements each point of sample of a Probenplatte in a 
conventional mass spectrometer with zirka 50 to 300 laser pulses of a nitrogen laser with a wavelength of 337 Nm 
became lively. The acquisition of positive ion mass spectra took place in the linear measuring mode in a mass 
range from 2000 to 20000 m/z. A typical example of a in this way received positive MALDI TOF of mass spectrum 
REF von Escherichia coli is in the top the Fig. 2 within the mass range from zirka m/z = 4000 to 14000 
represented. 

In the following step S2 (Fig. 1) is accomplished a peak allocation to certain molecular cell components. A 
possible proceeding, which falls back to well-known methods of biochemistry and molecular biology, is described 
briefly in the following by the example by Ribosomenproteine of the large Ribosomenuntereinheit. 



Identification of unknown quantities of signals 



A protein excerpt of a cell culture is isolated by means of a 2D-Gelelektrophorese. Submitted in question coming 
so-called Proteinspots afterwards a tryptischen digest, with which the protein is split enzymatically into small 
protein fragments. If anti-bodies are present against Ribosomen, the relevant Proteinspots can be recognized 
also by a Immunoassay (for example Western Blot analysis). By the tryptischen digest won protein fragments by 
means of a HPLC, which is suitable for particularly small sample quantities, are then isolated and ansequenziert. 
With in this way determined sequence fragments can then be tried to identify the Ribosomengene in a data base. 
If appropriate genes are present in the data base, the corresponding protein mass can be detemiined from the 
entire gene sequence. If an appropriate gene in the data base cannot be found, then the entire gene with well- 
known means of molecular biology, which are not to be implemented here more near, which for the appropriate 
ribosomale protein are coded , isolated and sequenziert, must. If the gene sequence is well-known, the translation 
in the protein sequence and determination of the theoretical protein mass follows. An examination of this 
theoretical mass can take place, as the appropriate protein poet of the 2D-Gelelektrophorese of a MALDI TOP 
Massenspektrometrie is subjected. In the case of deviations from the theoretical protein mass modifications of the 
protein can be determined by MALDI TOP analysis of the tryptischen Verdaus. 

For elucidation is in the Pig. 2 in the lower part a mass spectmm of the 70S-Ribosomens from Escherichia coli, 
which was isolated by means of 2D-Gelelektrophorese, represented. With 70S the entire Ribosomen of a protein 
is marked, which consists of the large 50S-Untereinheit and the small 30S-Untereinheit. Both subunits consist for 
their part of a set of proteins, which are named the letter L (for large) and the letter S (for small). It is easily 
evident that a number of the most intensive signals from the spectrum of Escherichia coli (see Pig. 2 top) to 
ribosomale proteins to attribute leaves themselves. Appropriate signals are marked in the illustration by arrows. 
The inventors succeeded in for the first time assigning three of these signals to certain proteins of the large 50S- 
Ribosomenuntereinheit. It concerns the proteins L29, L30 and L36 with the masses m/z = 7274, 6412 and 4364. 
Since these signals with a high reliability in the mass spectra of Escherichia emerge coli, they are particularly 
suitable for the Identification. It used as identified signals simmer for the synthetic reference spectrum of REPS for 
Escherichia coli. 

In an alternative or additional step S3 (Pig. 1) empirical signals Sem from the measured reference spectra of REP 
of the well-known micro organisms are detemiined. The determination of the empirical signals Sem takes place 
via comparison of a multiplicity of mass spectra, which were noted by the same trunk, among themselves as well 
as via comparison of these mass spectra with those from other organisms. Such signals are determined as 
characteristic for a microorganism, those if possible frequently in the mass spectra of the same organism to 
emerge and if possible rarely in the mass spectra of another. Por the frequency of an occunrence of a suitable 
empirical signal Sem thereby a minimum value, for example > related to all spectra of an organism, can be given 
to 70%. Likewise such a signal should possess a minimum intensity given in advance, in order to facilitate its 
distinction from the background noise to. The detenmination of the empirical signals Sem in the step S3 can take 
place via visual spectrum comparison via the user. It is however preferentially intended accomplishing this step 
automated with the help of suitable computer programs. Here for instance an algorithm is applicable, which 
examines the measured reference spectra of REP regarding the criteria mentioned. There is however also, for 
example well-known from the infrared spectrometry, computer-assisted procedures, which are with application of 
statistic algorithms able to recognize and filter recurring signals. 

In the steps the S2 and S3 determined identified and empirical signals simmer, Sem in a following step S4 into 
synthetic reference spectra of REPS are combined. For each well-known microorganism a reference spectrum of 
REFS is produced. Into the Pig. 3 to 6 is represented exemplarily such synthetic reference spectra of REPS for 



two Escherichia coli trunks (ATCC 25922 and ATCC 35218) and two Klebsiella species - Klebsiella pneumoniae 
and Klebsiella oxycoca -. In each case everyone is the Fig in the top. 3 to 6 the synthetic reference spectrum of 
REFS in coordinate form represented, while in the lower part the graphic representation is shown by mass 
spectra in the typical form in each case. The synthetic reference spectra of REFS cover in the examples shown 
eleven to fourteen signals S. thereby are in the Escherichia coli Referenzspektren REFS the signals identified as 
the proteins L29, L30 and L36 of the large SOS-Ribosomenuntereinheit von Escherichia coli simmer marked. 
These signals simmer emerge in both trunks of Escherichia coli. They are suitable for the identification of the kind 
and for the demarcation in relation to Klebsiella species, in which only one part of the identified signals simmer 
occurs. In particular becomes with Klebsiella (Fig. 5 and 6) the signal with the mass m/z = 6413 does not observe. 
The distinction of the two Escherichia coli trunks (Fig, 3 and 4) by such empirical signals Sem is made possible, 
which is observed only with one of both. A comparison in the Fig. it shows 3 and 4 synthetic reference spectra 
shown of REFS that the procedure according to invention is sensitive enough, in order to make a distinction 
possible of micro organisms even on master level. Besides also a distinction between Escherichia is made 
possible coli on the one hand and Klebsiella species on the other hand. 

In the step the 84 (Fig. 1) produced synthetic reference spectra of REFS are combined in a following step S5 into 
a data base railways. Within the data base railways the synthetic reference spectra of REFS can be arranged in 
logical way, for example according to family, kind, kind and trunk. The operational sequence from SI to S5, i.e. 
the production of the data base railways, must be accomplished only in principle once. To this data base railways 
can be fallen back then with the following steps again and again. Of course the data base railways should be 
constantly extended and updated by reference spectra of REFS of further micro organisms. Like that is about 
conceivable, reference spectra of REFS von Mutanten, in particular such with changed resistance and/or 
Virulenzverhalten to take up if these trunks supply characteristic signals. Also the existing reference spectra of 
REFS should be constantly optimized, for example by the admission of new signals simmer, Sem and/or by 
deletion of signals on basis of statistic evaluation of the analyzed samples. 

In the step S6 then the acquisition of a mass spectrum one takes place microorganism which can be identified. 
Favourable way is measured this sample spectrum of SAM under if possible identical Messbedingungen, in 
particular same matrix, as the reference spectra of REF in step S1, In the following (step S7) a similarity analysis 
of the sample spectrum of SAM with the synthetic reference spectra of REFS contained in the data base railways 
takes place. Also this spectrum alignment can take place visually, preferably however computer-assisted. Can 
resemble in principle to or similar algorithms fall back, which already found in step S3 for the determination of the 
empirical signals Sem application. The spectrum alignment can be accomplished by the simplicity of the used 
reference spectra of REFS in step S7 also with very simple algorithms, which only on a comparison of the signals 
simmer yourself, Sem of the synthetic reference spectra of REFS to limit. Of course tolerance criteria must be 
given, which specify, In order like much a which is applicable signal simmer, to Sem of the sample spectrum of 
SAM here regarding the mass and/or the intensity to deviate may, in order as agreeing to be rated. Furthermore a 
minimum number of agreeing signals should be given for an identification. In the step S8 an expenditure of a 
result takes place. This can consist either of the fact that an agreement of the sample spectrum of SAM with one 
of the reference spectra of REFS was recognized. Furthermore also infomiation can be spent over the degrees of 
the agreement. If it concerns - like frequently the case - with the sample of the unknown organism a Mischkultur, 
then the procedure makes possible even the identification of several, next to each other available micro 
organisms. In such a case as result several hits are spent. If the sample spectrum of SAM agrees with none of the 
synthetic reference spectra of REFS within the certified tolerances, i.e., the unknown microorganism Is contained 
not in the data base railways, then also this is a result capable of being output. 



In certain cases, in which a microorganism cannot be identified not or clearly, it can be favourably intended that 
following the step S7 an additional'direct comparison with the measured "natural" reference spectra of REF is 
accomplished. This procedure con^esponds to the well-known proceeding for the identification of micro organisms 
by means of MALDI TOF ms. 

By the simplicity and the concentrated information content of the synthetic reference spectra the procedure 
according to invention is characterised REFS by a substantially higher reliability. 

Reference symbol list 

51 measurement of reference spectra 

52 signal identification 

53 detennination of empirical signals 

54 production of a synthetic reference spectrum 

55 data base production 

56 collection of a sample spectrum 

57 spectrum alignment 

58 expenditure for result 
Simmer identified signal 
Sem empirical signal 

REF measured reference spectrum 
REFS synthetic reference spectrum 
Railways data base 
SAM sample spectrum 
RES result 



